期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 面向维吾尔语文本的改进后缀树聚类
翟献民 田生伟 禹龙 冯冠军
计算机应用    2012, 32 (04): 1078-1081.   DOI: 10.3724/SP.J.1087.2012.01078
摘要1219)      PDF (600KB)(402)    收藏
针对后缀树聚类选取基类时,基类短语出现信息不规范、重复和冗余的问题,提出了一种改进后缀树聚类算法。该算法首先以短语互信息算法改进基类的选取,选出遵守维吾尔语语法规则的基类短语;然后,利用短语归并算法对选取的重复基类短语进行归并;最后,在前两步的工作基础上,利用短语去冗余算法处理冗余的基类短语。实验证明,与传统后缀树聚类(STC)相比,改进后缀树聚算法的全面率、准确率都得到了提高。这表明,改进算法有效地改善了聚类效果。
参考文献 | 相关文章 | 多维度评价